text n. 1.原文,本文,正文;(文艺学等所说的)文本。 2.课文,课本,教科书。 3.基督教圣经经文,经句〔常引作说教题目〕。 4.主题,论题。 5.(歌谱的)歌词。 6.版本。 7.=text hand. a full text 全文,正文。a text in physics 物理课本。 stick to one's text (谈话)不离本题。
segment n. 1.(自然形成的)段落;断片;部分;分节;段;节。 2.【数学】(线)段;弓形。 3.圆缺;球缺。 4.环节;切片。 5.【生物学】分裂片;体节;环节;【植物;植物学】细裂片;全裂片。 6.【电学】整流子片;【计算机】程序段;【机械工程】扇形体;弧层;拼合轮缘。 a segment of an orange 橘子的一片。 the jointed segments of a bamboo stem 一根竹子的许多节段。 in segments 成节[段],分节[段]。 vi. 【生物学】分裂。 guide segment 弓形座。 mica segment 云母片。 vt. 分割,分裂;【生物学】使分裂。 a segmented worm 环虫。
The proposed model takes into account the subtopic structures of documents . it first splits the documents into text segments with texttiling and calculates the similarities for different pairs of text segments in the documents . lastly the overall similarity between the documents is returned by combining the similarities of different pairs of text segments with optimal matching method 该模型首先采用texttiling技术将文档分割成能代表子主题的文本块,然后计算两个文档中不同文本块之间的相似度,最后通过图论中的最优匹配方法综合文本块之间的相似度得到两个文档之间的总体相似度。